有毒内容是今天社交媒体平台最关键的问题之一。仅在2020年的印度拥有51800万社交媒体用户。为了为内容创造者及其观众提供良好的体验,这对销售毒性评论和发布的用户至关重要。但由于存在多个相同文本的多个表示,大挑战是识别低资源目录语言中的毒性。此外,社交媒体的职位/评论不遵守特定格式,语法或句子结构;这使得滥用检测的任务更具挑战性的多语种社交媒体平台。本文介绍了使用ShareChat / MoJ提供的数据提出的Team'Moj Masti'提出的系统,以\ emph {iiit-d多语言滥用评论识别}挑战。我们专注于我们如何利用基于多语言变压器的预训练和微调模型来接近代码混合/代码切换的分类任务。我们最好的表演系统是XLM-Roberta和Muril的集合,在测试数据/排行榜上实现了0.9的平均f-1分数。我们还通过添加音译数据观察到性能的增加。此外,使用弱元数据,合奏和一些后处理技术提升了我们的系统的性能,从而将我们1在排行榜上放置。
translated by 谷歌翻译
当试图将深度神经网络(DNN)适合相对于组$ g $的$ g $ invariant目标功能时,只有将DNN限制为$ g $ invariant才有意义。但是,可以有许多不同的方法来做到这一点,从而提出了“ $ g $ invariant神经体系结构设计”的问题:对于给定问题的最佳$ g $ invariant架构是什么?在我们考虑优化问题本身之前,我们必须了解搜索空间,其中的体系结构以及它们如何相互关系。在本文中,我们朝着这一目标迈出了第一步。我们证明了一个定理,该定理对所有有限的正交组$ g $ for Relu激活的所有$ g $ invariant单隐藏层或“浅”神经网络($ G $ -SNN)架构进行了分类。该证明是基于每条$ g $ -snn的信件,符合$ g $的签名置换表示,该代表作用于隐藏的神经元上。该分类是按照$ g $的第一阶层类别进行的,因此承认拓扑解释。根据代码实施,我们列举了某些示例组$ g $的$ G $ -SNN架构,并可视化它们的结构。我们在神经体系结构搜索(NAS)期间可以利用的枚举体系结构之间绘制网络形态。最后,我们证明,仅当其重量矩阵为零时,在给定的共同体学环中对应于给定的共同学环中的架构,并在NAS的背景下讨论了这一点的含义。
translated by 谷歌翻译
跟踪牲畜的行为能够早期发现,从而预防现代动物农场的传染病。除了经济增益之外,这将减少畜牧业养殖的抗生素量,否则进入人类饮食恼怒的抗生素抗性的流行病 - 死亡的主要原因。我们可以使用标准的摄像机,在大多数现代农场提供,以监控牲畜。然而,大多数计算机视觉算法在这项任务上表现不佳,主要是因为(i)农场繁殖的动物看起来相同,缺乏任何明显的空间签名,(ii)没有现有的跟踪器对于长期保持稳健,并且(iii)真实 - 改变照明,频繁遮挡,不同的相机角度和动物尺寸的诸如变化的条件使得模型概括为概括。鉴于这些挑战,我们开发了针对小组母猪的端到端行为监测系统,以执行同时实例级分段,跟踪,动作识别和重新识别(星)任务。我们呈现StarFormer,这是第一个端到端的多目标牲畜监测框架,通过使用变压器架构了解分组猪的实例级嵌入式。对于基准测试,我们展示了一种仔细的策划数据集,包括视频序列,其中具有实例级界限框,实际室内养殖环境中的猪的分段,跟踪和活动分类。在明星任务上使用同步优化,我们展示了星际器优于培训的流行基线模型,为个人任务培训。
translated by 谷歌翻译